4.5.1 진화 알고리즘 (Evolutionary Algorithms): 환경에 최적화된 로봇의 다리 길이, 관절 위치, 센서 배치를 AI가 설계
0.1 서론: 설계자로서의 인공지능과 엠바디드 인텔리전스의 진화적 구현
로봇 공학의 역사에서 하드웨어와 소프트웨어는 오랜 기간 동안 주종(主從) 관계에 가까웠다. 기계 공학적 직관과 물리적 제약에 따라 로봇의 신체(Body)가 먼저 규정되면, 제어 공학자와 컴퓨터 과학자들은 고정된 하드웨어 위에서 최적의 성능을 짜내기 위해 제어기(Brain)를 설계했다. 이러한 순차적 설계 방식(Sequential Design)은 인간의 인지적 한계를 반영한 공학적 타협이었으나, 동시에 로봇 지능의 발현을 근본적으로 제한하는 족쇄로 작용했다. 엠바디드 인텔리전스(Embodied Intelligence) 이론은 지능이 뇌라는 중앙 처리 장치에 고립된 연산 과정이 아니라, 뇌와 신체, 그리고 환경(Environment)의 동적인 상호작용 속에서 창발한다고 역설한다. 자연계의 진화 과정은 이를 증명하는 가장 거대한 실험장이다. 치타의 유연한 척추는 고속 주행을 위한 신경계와 함께 진화했고, 심해 생물의 감각 기관은 빛이 없는 환경에 적응하며 발달했다. 즉, 생물학적 지능은 하드웨어와 소프트웨어의 공진화(Co-evolution) 산물이다.
인공지능이 로봇의 제어를 넘어 설계의 영역으로 확장됨에 따라, 우리는 비로소 ’설계자로서의 AI’를 마주하게 되었다. 특히 진화 알고리즘(Evolutionary Algorithms, EA)은 자연 선택과 유전 메커니즘을 모방하여, 인간 엔지니어가 상상하기 힘든 창의적이고 비직관적인 로봇 형태를 탐색하는 데 핵심적인 도구로 자리 잡았다. 다리의 길이와 개수, 관절의 가동 범위, 그리고 센서의 미세한 위치까지, 로봇의 모든 물리적 파라미터는 이제 인간의 직관이 아닌 환경에 대한 적합도(Fitness) 함수에 의해 결정된다. 본 절에서는 최신 SOTA(State-of-the-Art) 연구들을 통해 진화 알고리즘이 어떻게 로봇의 형태와 제어를 동시에 최적화하는지, 그리고 이 과정에서 발생하는 난제들을 어떻게 극복하고 있는지 심층적으로 분석한다. 특히 Efficient automatic design of robots 1, RoboGrammar 2, Evolution Gym 3 등 2020년대 이후의 획기적인 연구 성과들을 중심으로, 진화적 로봇 설계(Evolutionary Robotics)의 현재와 미래를 조망한다.
0.2 로봇 형태 표현의 진화: 유전형에서 표현형으로
진화 알고리즘을 로봇 설계에 적용하기 위한 첫 번째 단계는 물리적 로봇을 유전 알고리즘이 조작 가능한 데이터 구조, 즉 유전형(Genotype)으로 변환하는 것이다. 이 인코딩(Encoding) 방식은 탐색 공간(Search Space)의 크기와 질을 결정하며, 진화의 효율성과 결과물의 다양성에 결정적인 영향을 미친다. 초기 연구들이 단순한 파라미터 나열에 그쳤다면, 최근의 연구들은 그래프 문법이나 생성적 신경망을 통해 더욱 복잡하고 정교한 구조를 표현하는 방향으로 발전하고 있다.
0.2.1 직접 인코딩(Direct Encoding)의 한계와 가능성
직접 인코딩은 로봇의 설계 변수(다리 길이, 모터 토크, 센서 좌표 등)를 실수 벡터(Real-valued Vector)나 비트스트링으로 직접 매핑하는 방식이다. 구현이 직관적이고 특정 파라미터의 미세 조정(Fine-tuning)에 유리하다는 장점이 있다. 예를 들어, Veenstra et al. (2019)의 연구 4에서는 모듈러 로봇의 형태를 진화시키는 데 있어 직접 인코딩이 특정 조건하에서 생성적 인코딩보다 빠른 수렴 속도를 보임을 확인하였다.
그러나 직접 인코딩은 확장성(Scalability) 문제에 취약하다. 로봇의 부품 수가 늘어날수록 유전자의 길이가 선형적으로, 혹은 기하급수적으로 증가하며, 이는 ’차원의 저주’를 야기한다. 또한, 다리의 개수가 변하거나 관절의 연결 구조(Topology)가 바뀌는 것과 같은 급격한 형태적 변화를 표현하기 어렵다. 이는 직접 인코딩이 주로 고정된 위상(Topology)을 가진 로봇의 치수 최적화(Dimensional Optimization)에 국한되어 사용되는 이유이다.
0.2.2 생성적 인코딩(Generative Encoding)과 CPPN
생물학적 DNA가 신체의 모든 세포 위치를 일일이 지정하지 않고, 성장과 분열의 규칙을 암호화하여 복잡한 유기체를 만들어내듯, 생성적 인코딩은 로봇의 형태를 생성하는 ’규칙’이나 ’함수’를 진화시킨다. 이 분야의 SOTA 기술인 **CPPN(Compositional Pattern Producing Networks)**은 인공 신경망의 일종으로, 공간 좌표 (x, y, z)를 입력받아 해당 위치의 속성(물질의 유무, 강성, 관절의 종류 등)을 출력한다.5
CPPN의 핵심적인 강점은 다음과 같다:
- 규칙성과 대칭성 (Regularity and Symmetry): CPPN은 사인(Sine), 코사인, 가우시안 등의 활성화 함수를 사용하여, 자연계 생물에서 흔히 볼 수 있는 좌우 대칭, 반복 구조(예: 지네의 다리 마디), 분절 구조를 자연스럽게 생성한다. 이는 물리적으로 안정적이고 효율적인 이동(Locomotion)이 가능한 형태를 도출할 확률을 높인다.
- 해상도 독립성 (Resolution Independence): CPPN은 연속 함수이므로, 동일한 유전형을 사용하여 저해상도의 시뮬레이션 모델부터 고해상도의 3D 프린팅 모델까지 손실 없이 생성할 수 있다.
- 복잡성 압축: 매우 복잡한 표현형도 상대적으로 간단한 네트워크 구조(유전형)로 압축하여 표현할 수 있어 탐색 효율이 높다.
최근 Evolution Gym 3과 같은 연구에서는 CPPN을 활용하여 수천 개의 복셀(Voxel)로 이루어진 연성 로봇(Soft Robot)을 진화시키고 있다. 여기서 CPPN은 각 복셀의 재질(단단함, 부드러움, 근육 등)을 결정하는 함수로 작용하여, 기존의 강체 로봇과는 차원이 다른 자유도를 가진 형태를 만들어낸다.
0.2.3 그래프 문법(Graph Grammar)과 제약 조건의 통합
로봇은 링크와 조인트가 연결된 그래프 구조로 추상화될 수 있다. RoboGrammar 2는 형식 언어학의 문법 규칙을 로봇 설계에 도입하여, ‘물리적으로 타당한’ 로봇만을 생성하도록 탐색 공간을 제약하는 혁신적인 접근법이다. 무작위적인 돌연변이는 종종 바퀴 위에 다리가 달리거나, 관절이 서로 겹치는 등 현실 불가능한 ’괴물(Monster)’을 만들어낸다. 그래프 문법은 이를 방지하기 위해 사전에 정의된 규칙(Production Rules) 집합을 사용한다.
- 규칙 예시:
Body -> (Head, Limbs),Limb -> (Link, Joint, End-effector) - 재귀적 생성: 문법 규칙을 재귀적으로 적용함으로써, 간단한 시작 심볼에서 출발하여 무한히 복잡한 구조로 확장할 수 있다.
Zhao et al. (2020)의 연구 2에서는 이러한 그래프 문법에 **그래프 휴리스틱 탐색(Graph Heuristic Search)**을 결합하였다. 이 알고리즘은 현재의 불완전한 설계(그래프 노드)가 미래에 얼마나 높은 성능을 낼 수 있을지 예측하는 가치 함수(Value Function)를 학습하여, 유망한 설계 분기(Branch)를 집중적으로 탐색한다. 그 결과, 평지에서는 바퀴 달린 로봇을, 계단에서는 4족 보행 로봇을, 빙판에서는 낮은 무게중심의 기어가는 로봇을 스스로 설계해내는 성과를 거두었다.8 이는 진화 알고리즘이 단순히 무작위 탐색에 의존하는 것이 아니라, 설계 규칙이라는 지식(Knowledge)을 내재화할 수 있음을 보여준다.
0.3 형태와 제어의 공진화(Brain-Body Co-Optimization) 동역학
로봇의 형태를 진화시키는 것만으로는 충분하지 않다. 새로운 형태는 그에 맞는 새로운 제어 정책을 필요로 한다. 따라서 진화 로봇 공학의 핵심은 형태 최적화(Morphological Optimization)와 제어 최적화(Control Optimization)가 맞물려 돌아가는 공진화 루프(Co-evolutionary Loop)를 설계하는 것이다. 그러나 이 과정은 이론적으로나 실용적으로나 거대한 난관에 봉착해 있다.
0.3.1 공진화의 딜레마와 형태학적 혁신 보호(Morphological Innovation Protection)
형태와 제어를 동시에 최적화할 때 가장 큰 문제는 **‘미숙함에 대한 불공정한 평가’**이다. 기존 세대에서 살아남은 개체들은 이미 자신의 신체 구조에 맞춰 제어 정책이 어느 정도 최적화된 상태이다. 반면, 돌연변이에 의해 막 태어난 새로운 신체 구조(예: 다리가 하나 더 늘어난 로봇)는 기구학적 잠재력은 뛰어날지 몰라도, 기존의 제어기와는 불일치(Mismatch)를 일으켜 초기 성능이 형편없을 수밖에 없다. 진화의 선택 압력(Selection Pressure)이 강한 환경에서 이러한 ’유망한 유아’들은 자신의 잠재력을 증명할 시간을 갖기도 전에 도태된다. 이는 진화가 국소 최적해(Local Optima)인 단순하고 익숙한 구조에 고착화(Premature Convergence)되는 주원인이다.9
이를 해결하기 위해 SOTA 연구들은 형태학적 혁신 보호 기법을 도입한다.6
- 나이 기반 보호 (Age-based Protection): 개체의 적합도를 평가할 때, 절대적인 성능뿐만 아니라 그 개체가 얼마나 오랫동안 최적화되었는지(나이)를 고려한다. 파레토 지배(Pareto Domination) 개념을 도입하여, 성능은 낮더라도 나이가 젊은 개체는 도태시키지 않고 보존한다. 이는 새로운 형태가 자신의 제어기를 학습할 충분한 ’유예 기간’을 보장한다.
- 종 분화 (Speciation): 유전적으로 유사한 개체들끼리만 경쟁을 붙이는 니치(Niche) 기법을 사용한다. 형태가 급격하게 변한 개체는 기존 집단과 다른 종으로 분류되어, 자신과 비슷한 변종들과 경쟁하므로 초기 성능 저하로 인한 즉각적인 도태를 피할 수 있다.
0.3.2 내포된 최적화 루프(Nested Optimization Loops)의 효율화
표준적인 공진화 프레임워크는 외부 루프(진화)와 내부 루프(학습)의 이중 구조를 가진다.
- 외부 루프 (Outer Loop): 진화 알고리즘이 로봇의 형태(하드웨어 파라미터)를 탐색한다.
- 내부 루프 (Inner Loop): 생성된 형태에 대해 강화학습(RL)이나 최적 제어(Optimal Control)를 수행하여 제어 정책을 학습시킨다.
문제는 내부 루프의 계산 비용이다. 하나의 로봇 형태를 평가하기 위해 수백만 번의 시뮬레이션 스텝이 필요한 강화학습을 수행한다면, 전체 진화 과정은 계산적으로 감당 불가능해진다. 최근 연구인 Efficient automatic design of robots 1은 이 문제를 해결하기 위해 내부 루프에 미분 가능한 모델 예측 제어(MPC)나 초고속 강화학습 알고리즘을 도입하여, 단 수 초 만에 제어 성능을 근사(Approximation)해내는 전략을 취한다. 또한, Gupta et al. (2021) 등은 제어 정책을 처음부터 학습하는 대신, 이전 세대의 제어 정책을 전이 학습(Transfer Learning)하여 내부 루프의 수렴 속도를 비약적으로 높이는 방법을 제안하였다.12
0.4 센서 배치 최적화(Optimal Sensor Placement): 정보 이득의 극대화
로봇의 성능은 환경 정보를 얼마나 정확하게 획득하느냐에 달려 있다. 센서의 수와 위치는 비용, 전력, 데이터 처리 대역폭의 제약을 받으므로, 최소한의 센서로 최대한의 정보를 얻는 **최적 센서 배치(Optimal Sensor Placement, OSP)**는 진화적 설계의 중요한 축이다. 2024-2025년의 연구들은 단순한 커버리지(Coverage) 확대를 넘어, 정보 이론(Information Theory)과 제어 이론을 결합한 심층적인 접근을 보여준다.
0.4.1 정보 이론 기반의 목적 함수
진화 알고리즘은 센서의 좌표 (x, y, z)와 지향각 (\theta, \phi)를 유전자로 하여, 해당 센서 구성이 제공하는 정보량을 최대화하는 방향으로 진화한다. 이때 적합도 함수(Fitness Function)로 주로 사용되는 지표들은 다음과 같다.14
- 피셔 정보 행렬 (Fisher Information Matrix, FIM): FIM은 관측 데이터가 추정하고자 하는 상태 변수(로봇의 위치, 장애물과의 거리 등)에 대해 얼마나 많은 정보를 담고 있는지를 정량화한다. FIM의 행렬식(Determinant)을 최대화(D-optimality)하거나, 역행렬의 대각합(Trace)을 최소화(A-optimality)하는 것은 추정 오차의 분산을 최소화하는 것과 동치이다. 29의 연구에서는 수중 로봇의 위치 추정을 위해 유전 알고리즘을 사용하여 FIM 기반의 목적 함수를 최적화하였으며, 그 결과 직관적으로는 알기 힘든 비대칭적 센서 배치가 특정 기동(Maneuver) 시나리오에서 훨씬 높은 정확도를 보임을 입증하였다.
- 상호 정보량 (Mutual Information, MI): 센서 측정값과 관심 영역(Region of Interest)의 실제 상태 사이의 상호 정보량을 최대화한다. 이는 특히 가우시안 프로세스(Gaussian Process)를 이용한 환경 모델링에서 유용하며, 불확실성(Entropy)이 높은 지역을 우선적으로 관측하도록 센서를 배치하는 데 활용된다.
- 문맥 의존적 상호 정보량 (Context-Relevant Mutual Information, CRMI): 단순히 환경 전체의 정보를 얻는 것이 아니라, 로봇의 경로 계획(Path Planning)에 영향을 미치는 정보만을 선별적으로 획득하도록 설계된 지표이다.14 이는 ’필요한 정보만 본다’는 경제성을 구현한다.
0.4.2 메타센서(Metasensor)와 능동적 지각(Active Perception)
최신 연구 흐름은 센서를 수동적인 데이터 수집 장치가 아니라, 제어 루프의 능동적인 구성 요소로 격상시키는 것이다. 메타센서 개념은 로봇이 자신의 과업 수행에 필요한 정보를 스스로 정의하고, 이를 획득하기 위한 센서 구성을 진화시키는 것을 의미한다.16
예를 들어, 험지 주파 로봇의 경우 전방을 넓게 보는 것보다 발이 닿을 지점의 지면 마찰력을 감지하는 것이 더 중요할 수 있다. 진화 알고리즘은 시뮬레이션 상의 수많은 실패(넘어짐) 데이터를 학습하여, 로봇의 발바닥이나 무릎과 같은 부위에 촉각 센서를 집중 배치하거나, 라이다(LiDAR)의 스캔 패턴을 주행 방향에 맞춰 비대칭적으로 변형시킨다. 이는 형태학적 연산(Morphological Computation)의 개념을 감각 시스템으로 확장한 것으로, 센서의 물리적 배치 자체가 정보 필터링(Filtering) 역할을 수행하게 하여 중앙 처리 장치의 부하를 줄이는 효과를 낳는다.
또한, 구조 건전성 모니터링(SHM) 분야에서는 대형 구조물이나 로봇 외피(Skin)에 수천 개의 센서를 배치할 수 있는 잠재적 위치(Candidate Sites) 중에서, 가장 유의미한 신호를 주는 소수의 센서만을 활성화하는 부분집합 선택(Subset Selection) 문제에 유전 알고리즘을 적용하고 있다. Laflamme et al. (2017)은 학습 유전자 풀(Learning Gene Pool)을 도입하여, 진화 과정에서 ’정보가 풍부한 위치’에 대한 지식을 세대 간에 전승시킴으로써 탐색 효율을 높이는 기법을 제안하였다.18
0.5 다양성 품질(Quality-Diversity) 알고리즘: MAP-Elites의 혁명
전통적인 진화 알고리즘이 단 하나의 ‘최고 성능(Best Fitness)’ 개체를 찾는 수렴형 접근이었다면, 최근 로봇 공학계는 Quality-Diversity (QD) 알고리즘으로의 거대한 전환을 맞이하고 있다. 복잡하고 예측 불가능한 현실 세계에서는 단 하나의 정답보다는, 다양한 상황에 대처할 수 있는 ‘다양하고 고성능인(Diverse and High-performing)’ 해법의 레퍼토리가 훨씬 가치 있기 때문이다. 이 흐름의 중심에는 MAP-Elites (Multi-dimensional Archive of Phenotypic Elites) 알고리즘이 있다.20
0.5.1 MAP-Elites의 작동 원리
MAP-Elites는 탐색 공간을 다차원 특징 맵(Feature Map)으로 구조화한다.
- 특징 공간 정의: 사용자는 로봇의 특성을 나타내는 몇 가지 차원(Behavioral Descriptors)을 정의한다. 예를 들어, X축은 ‘로봇의 높이’, Y축은 ‘에너지 소모량’, Z축은 ’다리의 개수’가 될 수 있다. 이 공간은 수많은 격자(Cell)로 나뉜다.
- 조명 (Illumination): 알고리즘은 무작위로 생성되거나 변이된 개체를 시뮬레이션하여 성능(Fitness)과 특징을 측정한다. 그리고 해당 개체를 특징에 맞는 격자 셀에 매핑한다.
- 엘리트 보존: 만약 해당 셀이 비어있다면 개체를 저장한다. 이미 다른 개체가 있다면, 둘 중 성능이 더 뛰어난 개체만을 남긴다(Elitism).
- 반복: 이 과정을 반복하면, 맵의 각 셀에는 해당 특징 조합을 가진 로봇 중 가장 성능이 뛰어난 ’엘리트’가 채워지게 된다.
결과적으로 설계자는 “빠르지만 에너지를 많이 쓰는 로봇”, “느리지만 매우 안정적인 로봇”, “다리가 길어 장애물 넘기에 유리한 로봇” 등 수천 가지의 최적화된 설계 대안을 한눈에 파악할 수 있는 ’지도’를 얻게 된다. 이는 설계자에게 단순한 최적해 이상의 통찰(Insight)을 제공한다.
0.5.2 지능적 시행착오(Intelligent Trial and Error)와 손상 복구
MAP-Elites로 생성된 방대한 행동 라이브러리는 로봇의 생존성을 극대화하는 데 활용된다. Nature에 게재된 획기적인 연구인 Cully et al. (2015) 20은 다리가 부러진 6족 보행 로봇이 MAP-Elites로 미리 생성된 ’보행 기법 지도’를 활용하여 즉각적으로 적응하는 과정을 보여주었다.
- 사전 (Prior): 시뮬레이션 상에서 수만 가지의 보행 패턴(일부는 다리를 절거나, 끄는 등의 변칙적인 방법 포함)을 생성하여 맵에 저장한다.
- 적응 (Adaptation): 실제 로봇이 손상을 입어 성능이 떨어지면, 베이지안 최적화(Bayesian Optimization)를 사용하여 맵 상의 보행 패턴 중 현재의 손상된 신체로도 이동 가능한 패턴을 빠르게 검색한다.
- 결과: 로봇은 단 몇 번의 시행착오(Trial)와 2분 미만의 시간 내에, 부러진 다리를 사용하지 않거나 다른 다리로 보상하는 새로운 보행법을 찾아내어 임무를 지속한다. 이는 진화 알고리즘이 설계 단계뿐만 아니라, 운용 단계에서의 실시간 적응성(Adaptability)까지 보장할 수 있음을 증명한다.
0.6 SOTA 기술 심층 분석: 미분 가능한 시뮬레이션과의 결합
순수 진화 알고리즘(Gradient-free)은 미분 불가능한 위상 변화를 다룰 수 있다는 장점이 있지만, 샘플 효율성(Sample Efficiency)이 낮다는 고질적인 단점이 있다. 반면, 미분 가능한 시뮬레이터(Differentiable Simulator)를 이용한 경사 기반 최적화(Gradient-based Optimization)는 빠르지만 국소 최적해에 빠지기 쉽다. 2024-2025년의 최신 연구 트렌드는 이 둘의 장점을 결합한 하이브리드 아키텍처로 수렴하고 있다.24
0.6.1 Efficient Automatic Design of Robots
1 분석
Matthews et al. (2023)의 연구는 진화와 경사 하강법의 결합이 가져오는 파괴적인 혁신을 보여준다.
- 방법론: 외부 루프에서는 유전 알고리즘이 로봇의 형태(뼈대의 연결 구조, 복셀의 배치)를 탐색한다. 이는 미분 불가능한 영역이다. 내부 루프에서는 미분 가능한 물리 엔진을 사용하여, 해당 형태에 대한 제어 정책을 경사 하강법으로 초고속 최적화한다.
- 결과: 기존의 순수 진화 방식이 며칠의 슈퍼컴퓨팅 시간을 요구했던 것과 달리, 이 하이브리드 방식은 소비자용 PC 한 대에서 단 수 초(Seconds) 만에 백지상태에서 보행 로봇을 진화시키는 데 성공했다.
- 통찰: 연구진은 진화가 진행될수록 로봇의 형태가 ‘점점 더 미분 가능해지는(Increasingly Differentiable)’ 방향으로 진화한다는 사실을 발견했다.25 즉, AI는 단순히 성능이 좋은 신체를 찾는 것을 넘어, 제어 정책을 학습시키기 유리한(Loss Landscape가 부드러운) 신체 구조를 선호하게 된다. 이는 형태가 학습의 난이도를 결정한다는 엠바디드 인텔리전스의 강력한 증거이다.
0.6.2 Evolution Gym
3: 복셀 기반 연성 로봇의 벤치마크
MIT와 구글 연구진이 제안한 Evolution Gym은 형태-제어 공진화 알고리즘을 평가하기 위한 표준 벤치마크이다.
- 구성: 수천 개의 복셀로 구성된 연성 로봇을 설계하고, 걷기, 물건 옮기기, 턱걸이 등 다양한 과업을 수행하게 한다. 각 복셀은 강체(Rigid), 연성(Soft), 수평/수직 액추에이터 등 다양한 물성을 가질 수 있다.
- 의의: 이 벤치마크는 단순한 이동(Locomotion)을 넘어 조작(Manipulation)과 지형 적응(Terrain Adaptation)까지 포함함으로써, 진화 알고리즘이 해결해야 할 문제의 복잡도를 한 단계 높였다. 여기서 우수한 성능을 보이는 알고리즘들은 대부분 진화적 탐색(GA)과 강화학습(PPO, SAC)을 계층적으로 결합한 형태를 띠고 있다.
0.7 현실 세계로의 전이(Sim-to-Real)와 미래 전망
진화 알고리즘으로 설계된 기괴하고 복잡한 로봇들은 시뮬레이션 속에서는 완벽하게 작동하지만, 현실 세계로 나오면 작동하지 않는 경우가 많다. 이를 Sim-to-Real Gap이라 부르며, 진화 로봇 공학의 상용화를 가로막는 최후의 장벽이다.
0.7.1 제조 가능성(Manufacturability)을 고려한 진화
SOTA 연구들은 ’제조 가능한 것만 진화시킨다’는 원칙을 도입하고 있다.
- RoboGrammar의 접근: 그래프 문법 규칙 자체에 시판되는 모터 모듈, 브라켓, 배터리의 규격을 반영하여, 생성된 모든 설계가 조립 가능하도록 보장한다.7
- 재질 모델링의 고도화: 시뮬레이터 내에 3D 프린팅 재료의 비선형적 탄성, 모터의 백래시(Backlash), 센서 노이즈 모델을 정밀하게 반영하거나, 아예 진화 과정에 노이즈를 주입(Domain Randomization)하여 현실의 불확실성에 강건한(Robust) 형태를 진화시킨다.
0.7.2 결론: 맞춤형 로봇(Bespoke Robots)의 시대
4.5.1절에서 살펴본 기술들은 로봇 공학의 패러다임을 근본적으로 변화시키고 있다. AI는 이제 주어진 몸을 제어하는 운전자를 넘어, 몸 자체를 창조하는 설계자로 진화했다. 다리의 길이, 관절의 위치, 센서의 배치는 더 이상 인간 엔지니어의 직관이나 경험칙(Rule of Thumb)에 의존하지 않는다. 진화 알고리즘은 환경의 제약 조건과 임무의 요구사항을 입력으로 받아, 수백만 년의 자연 선택을 압축한 고속 시뮬레이션을 통해 최적의 기계 생명체를 잉태해낸다.
향후 이 기술은 ‘개인화된 로봇(Bespoke Robots)’ 시대를 열 것이다. 재난 현장의 잔해 틈새를 기어가야 하는 구조 로봇, 환자의 신체 곡면에 딱 맞는 재활 로봇, 행성의 낯선 지형을 탐사해야 하는 우주 로봇 등, 표준화된 양산형 로봇이 해결할 수 없는 특수한 문제들에 대해 AI는 즉석에서 최적의 하드웨어를 설계하고, 3D 프린팅과 자동 조립 기술을 통해 이를 물리적 실체로 구현할 것이다. 하드웨어와 소프트웨어의 경계가 허물어지는 이 지점에서, 로봇은 진정한 의미의 엠바디드 인텔리전스를 획득하게 될 것이다.
0.8 [표 4.5.1-1] 주요 진화적 로봇 설계 알고리즘 및 특징 비교
| 분류 | 알고리즘/방법론 | 형태 인코딩 방식 | 주요 특징 및 메커니즘 | 장점 | 한계점 | 대표 연구 |
|---|---|---|---|---|---|---|
| 생성적 인코딩 | CPPN-NEAT | CPPN (신경망) | 좌표 공간을 물성으로 매핑. 신경망의 가중치와 위상을 진화시킴. | 자연스러운 대칭성, 반복 구조 생성. 해상도 무관(Resolution Independent). | 물리적 제약(제조 가능성 등)을 강제하기 어려움. | Cheney et al. (2013) 28 |
| 그래프 문법 | RoboGrammar | Graph Grammar | 사전에 정의된 문법 규칙을 통해 부품을 조립. 그래프 탐색 알고리즘 활용. | 현실적이고 제조 가능한 로봇만 생성. 탐색 공간을 유의미하게 제한. | 문법 규칙(Rule Set)을 사람이 사전에 정교하게 설계해야 함. | Zhao et al. (2020) 2 |
| 다양성 탐색 | MAP-Elites | 직접/간접 인코딩 모두 가능 | 다차원 특징 맵(Feature Map)에 엘리트 개체를 보존. 조명(Illumination) 알고리즘. | 단일 최적해가 아닌 다양한 고성능 해 집합 도출. 손상 복구에 탁월. | 고차원 특징 공간에서는 맵의 크기가 폭발적으로 증가(Curse of Dimensionality). | Cully et al. (2015) 20 |
| 하이브리드 | Evolution + Differentiable Sim | 직접/복셀 인코딩 | 형태는 진화(GA)로, 제어는 미분 시뮬레이션 기반 경사 하강법으로 최적화. | 기존 진화 방식 대비 수십~수백 배 빠른 수렴 속도. 학습 친화적 형태 도출. | 미분 가능한 시뮬레이터 구축 필요. 복잡한 충돌/접촉 모델링의 어려움. | Matthews et al. (2023) 1 |
| 센서 최적화 | Info-Gain Maximization | 직접 인코딩 (좌표, 각도) | FIM(피셔 정보), 엔트로피 등 정보 이론 지표를 적합도 함수로 사용. | 불확실성을 최소화하는 최적의 센서 위치/수량 결정. 능동적 지각 구현. | FIM 계산 등의 연산 비용이 높음. 동적 환경 모델링의 복잡성. | Laflamme et al. (2017) 18 |
1. 참고 자료
- [2306.03263] Efficient automatic design of robots - arXiv, https://arxiv.org/abs/2306.03263
- RoboGrammar: Graph Grammar for Terrain-Optimized Robot Design - DSpace@MIT, https://dspace.mit.edu/handle/1721.1/158234
- Evolution Gym: A Large-Scale Benchmark for Evolving Soft Robots - People, https://people.csail.mit.edu/jiex/papers/EvoGym/paper.pdf
- Comparing encodings for performance and phenotypic exploration in evolving modular robots - VU Research Portal, https://research.vu.nl/ws/portalfiles/portal/207655149/Comparing_encodings_for_performance_and_phenotypic_exploration_in_evolving_modular_robots.pdf
- Evaluation of frameworks that combine evolution and learning to design robots in complex morphological spaces, https://eprints.whiterose.ac.uk/id/eprint/203144/1/Wei_s_IEEE_paper_Evaluation_of_frameworks_that_combine_evolution_and_learning_to_design_robots_in_complex_morphological_spaces.pdf
- Scalable co-optimization of morphology and control in embodied machines - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC6030623/
- RoboGrammar: Graph Grammar for Terrain-Optimized Robot Design, https://cdfg.mit.edu/assets/files/robogrammar.pdf
- Robogrammar: graph grammar for terrain-optimized robot design - Andrew Spielberg, https://www.andrewspielberg.com/robogrammar-graph-grammar-for-terrain-optimized-robot-design
- [2402.09231] Investigating Premature Convergence in Co-optimization of Morphology and Control in Evolved Virtual Soft Robots - arXiv, https://arxiv.org/abs/2402.09231
- Scalable co-optimization of morphology and control in embodied machines - PubMed, https://pubmed.ncbi.nlm.nih.gov/29899155/
- Efficient automatic design of robots - PMC - NIH, https://pmc.ncbi.nlm.nih.gov/articles/PMC10576117/
- Co-optimization of Morphology and Behavior of Modular Robots via Hierarchical Deep Reinforcement Learning, https://www.roboticsproceedings.org/rss19/p096.pdf
- Co-optimization of Morphology and Behavior of Modular Robots via Hierarchical Deep Reinforcement Learning - ResearchGate, https://www.researchgate.net/publication/372801563_Co-optimization_of_Morphology_and_Behavior_of_Modular_Robots_via_Hierarchical_Deep_Reinforcement_Learning
- Optimal Coupled Sensor Placement and Path-Planning in Unknown Time -Varying Environments - arXiv, https://arxiv.org/html/2502.00185v2
- Optimal Coupled Sensor Placement and Path Planning in Unknown Time-Varying Environments | Journal of Guidance, Control, and Dynamics, https://arc.aiaa.org/doi/abs/10.2514/1.G009081
- Metasensor: A Proposal for Sensor Evolution in Robotics - MDPI, https://www.mdpi.com/1424-8220/25/3/725
- Metasensor: a proposal for sensor evolution in robotics - arXiv, https://arxiv.org/pdf/2406.08005
- Optimal Sensor Placement within a Hybrid Dense Sensor Network using an Adaptive Genetic Algorithm with Learning Gene Pool - Iowa State University, https://faculty.sites.iastate.edu/laflamme/files/inline-files/Laflamme_J31_2017.pdf
- (PDF) Optimal sensor placement within a hybrid dense sensor network using an adaptive genetic algorithm with learning gene pool - ResearchGate, https://www.researchgate.net/publication/316567874_Optimal_sensor_placement_within_a_hybrid_dense_sensor_network_using_an_adaptive_genetic_algorithm_with_learning_gene_pool
- Jean-Baptiste Mouret :: Robots that can adapt like natural animals, https://members.loria.fr/jbmouret/nature_press.html
- Trial-and-error damage recovery - GT S3, http://gt-s3.cran.univ-lorraine.fr/doc/2016_11_16_Mouret.pdf
- MAP-Elites Enables Powerful Stepping Stones and Diversity for Modular Robotics - Frontiers, https://www.frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2021.639173/full
- Harris Associate Professor, Computer Science Senior Research Manager (Staff Scientist) - OpenAI, https://cdn.openai.com/symposium-2019/jeff.pdf
- Guiding Evolutionary Strategies by Differentiable Robot Simulators, http://www.robot-learning.ml/2021/files/B2.pdf
- [2405.14712] Evolution and learning in differentiable robots - arXiv, https://arxiv.org/abs/2405.14712
- Evolution and learning in differentiable robots - arXiv, https://arxiv.org/html/2405.14712v1
- Evolution Gym: A Large-Scale Benchmark for Evolving Soft Robots - Jagdeep Bhatia, https://jagdeepsb.github.io/assets/pdf/evogym%20neurips%202021.pdf
- Generating Freeform Endoskeletal Robots - arXiv, https://arxiv.org/html/2412.01036v1
- Genetic Algorithm to Solve Optimal Sensor Placement for Underwater Vehicle Localization with Range Dependent Noises - PMC - NIH, https://pmc.ncbi.nlm.nih.gov/articles/PMC9570755/